abc Matlab - elektronski priručnik
VII dio Dodaci /APPENDIX/ - 7.3. Osnove deskriptivne statistike

7.3.2. Primjer 1.

Državni revizor kontroliše tačnost knjiženja knjigovodstvenih zapisa. Odabirući 30 uzoraka od kojih se svaki sastoji od tačno 20 knjigovodstvenih zapisa bilježio je broj pogrešnih zapisa u svakom uzorku. Dobio je sljedeće podatke:
3, 5, 2, 2, 5, 7, 6, 3, 1, 4, 8, 0, 0, 3, 6, 2, 5, 3, 0, 1, 6, 4, 4, 7, 2, 1, 6, 0, 3, 5

Prikažimo te podatke tablično, odredimo apsolutnu, relativnu, kumulativnu apsolutnu i kumulativnu relativnu frekvenciju ''manje od'' modaliteta 4, te sve osnovne numeričke parametre ovog statističkog niza, pa ih interpretirajmo.

Kako smo rekli, zadani niz ''sirovih'' podataka najprije zapišemo u obliku jednoredne matrice u običnu m–datoteku. Nazovimo tu datoteku pogreske.m. U nju ukucamo (u jednom redu):

x = [3, 5, 2, 2, 5, 7, 6, 3, 1, 4, 8, 0, 0, 3, 6, 2, 5, 3, 0,1, 6, 4, 4, 7, 2, 1, 6, 0, 3, 5]

sačuvamo unesene podatke i vratimo se u radni prostor. U njegovom novom redu ukucamo:

pogreske

i MATLAB će ispisati:

Prikažimo najprije te podatke tablično. Uočimo da se gornji niz sastoji od ukupno 9 različitih vrijednosti (modaliteta): 0, 1, 2, 3, 4, 5, 6, 7 i 8. Svaka od tih vrijednosti pojavljuje se u nizu određeni broj puta, pa najprije moramo odrediti te brojeve. U tu svrhu kreirajmo m–datoteku af.m (u direktoriju C:\matlabR12\work) koja sadrži jedino funkciju af čija je jedina ulazna varijabla matrica x, a izlazne varijable matrice a i f koje sadrže sve različite elemente niza poredane od najmanjeg do najvećeg, te njihove apsolutne frekvencije.

Ukucamo:

function [a,f]=af(x)
x=sort(x); j=1; broj=1;
for k=2:size(x,2)
if x(k)==x(k-1), broj=broj+1;
else f(j)=broj; a(j)=x(k-1); broj=1; j=j+1; end
a(j)=x(k); f(j)=broj;
end

Sačuvamo ukucane naredbe i vratimo se u radni prostor. Ukucamo:

[a,f]=af(x)

i dobićemo:

Iz tablice očitamo da je apsolutna frekvencija modaliteta 4 jednaka 3, što interpretiramo ovako: U ukupno 3 uzorka bilo je tačno 4 pogrešna zapisa. Izračunajmo sada relativnu frekvenciju tog modaliteta prema njenoj definicionoj formuli. Ukucamo:

r=4/30*100

i dobićemo:

r =
13.33333333333333

Taj broj interpretiramo ovako: U ukupno 13.333% uzoraka bilo je tačno 4 pogrešna zapisa.

Prijeđimo na izračunavanje kumulativnih frekvencija ''manje od''. Kumulativnu apsolutnu frekvenciju ''manje od'' podatka 4 dobijamo tako da saberemo apsolutne frekvencije svih modaliteta koji su manji ili jednaki 4, a to su 0, 1, 2, 3 i 4. Ukucamo:

kaf=4+3+4+5

i dobijemo:

kaf =
16

Taj broj interpretiramo ovako: U ukupno 16 uzoraka bilo je najviše 4 pogrešna zapisa.
Pripadnu kumulativnu relativnu frekvenciju određujemo ukucavanjem:

krf=16/30*100

Dobijemo:

krf =
53.33333333333334

Taj broj interpretiramo ovako: U ukupno 53.333% uzoraka bilo je najviše 4 pogrešna zapisa.
Preostaje nam još da izračunamo i interpretiramo osnovne numeričke parametre ovog niza. Izračunaćemo ih pomoću funkcijske m–datoteke negrupisani.m kako bismo izbjegli višekratno ukucavanje niza istih naredbi. Otvorimo novu m–datoteku i ukucamo:

function [sv,v,sd,kv]=negrupisani(x);
sv=mean(x);
v=var(x);
sd=std(x);
kv=sd/sv*100;

Sačuvamo unesene naredbe i vratimo se u radni prostor. U novi red ukucamo:

[sv,v,sd,kv]=negrupisani(x)

i dobijemo:

sv =
3.46666666666667

v =
5.42988505747126

sd =
2.33021137613549

kv =
67.21763585006228

Te brojeve redom interpretiramo ovako:

Prosječan broj pogrešaka u jednom uzorku (ili po jednom uzorku) iznosi 3.466667.
Prosječno kvadratno odstupanje broja pogrešaka od aritmetičke sredine iznosi 5.42989.
Prosječno odstupanje broja pogrešaka od aritmetičke sredine iznosi 2.33021.
Raspršenost pogrešaka oko prosječnog broja pogrešaka je 67.21764% (prilično velika, što znači da se podaci slabo grupišu oko aritmetičke sredine).

Želimo li obrađene podatke da prikažemo grafički, to možemo učiniti na više načina. Najčešći prikazi su poligon apsolutnih frekvencija (ili mnogougao učestalosti), jednostavne kolone i jednostavni redovi. Dobijamo ih koristeći naredbe plot, bar i barh. Ukucamo najprije:

plot(a,f)

i dobićemo sljedeći graf::

Ova kriva prikazuje zavisnost apsolutnih frekvencija o modalitetima, tj. zavisnost vrijednosti matrice f o vrijednostima matrice a. Znatno poznatiji prikaz jesu jednostavne kolone. Zatvorimo prethodnu sliku, vratimo se u radni prostor i u njegov novi red ukucamo:

bar(a,f)

Dobićemo sljedeću sliku:

Želimo li vizualno efektniji prikaz, možemo ukucati:

bar3(a,f)

što daje sljedeću trodimenzionalnu sliku:

Potpuno analogno postupamo i u slučaju prikazivanja pomoću jednostavnih redova.
Zatvorimo prethodne slike. U novi red radnog prostora ukucamo:

barh(a,f)

i dobijemo:


Ukoliko i ovdje želimo trodimenzionalni prikaz, ukucaćemo:

bar3h(a,f)

i dobiti sliku:

Ovim je obrada i analiza zadanog niza završena.

 

Kvantitativna diskretna statistička obilježja    <    Index    >    Kvantitativna diskretna statistička obilježja - Primjer 2.